Фрагмент для ознакомления
2
ВВЕДЕНИЕ
Актуальность темы исследования. Трендовые модели необходимы для решения задачи прогнозирования процессов [1,2]. Процесс построения трендовых моделей включает ряд этапов [1,3]. Начальный этап – анализ, исследование самой реальной системы. Необходимо выделение его основных структурных элементов и выявление основных параметров, определяющих динамику функционирования изучаемого объекта.
Математическое ожидание случайной величины X (обозначается M(X) или реже E(X)) характеризует среднее значение случайной величины (дискретной или непрерывной). Мат. ожидание - это первый начальный момент заданной СВ.
Математическое ожидание относят к так называемым характеристикам положения распределения (к которым также принадлежат мода и медиана). Эта характеристика описывает некое усредненное положение случайной величины на числовой оси. Скажем, если матожидание случайной величины - срока службы лампы, равно 100 часов, то считается, что значения срока службы сосредоточены (с обеих сторон) от этого значения (с тем или иным разбросом, о котором уже говорит дисперсия).
Цель исследования – изучить и проанализировать трендовые модели и понятие о «среднем» в медико-биологических исследованиях.
Задачи исследования:
1) изучить трендовые модели и понятие о «среднем» в медико-биологических исследованиях;
2) выполнить практические расчеты.
Объект исследования – трендовые модели и понятие о «среднем».
Предмет исследования – медико-биологические исследования.
Структура работы: введение, две главы, заключение и список использованных источников.
1 ТРЕНДОВЫЕ МОДЕЛИ И ПОНЯТИЕ О «СРЕДНЕМ» В МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ
Ни для кого не секрет, что в настоящее время к статистической обработке медико-биологических данных предъявляются все более серьезные требования при представлении их в научные издания. В прошлом анализ статистического наполнения научно-исследовательских работ полностью отдавался на откуп научным рецензентам. Однако сейчас в большинстве научных изданий существует специальная служба рецензентов, специализирующихся только на статистике. К статистической обработке данных диссертационных исследований также должны соответствовать более строгим требованиям. Кроме того, статистическая наука не стоит на месте, и правила представления данных, актуальные 20 лет назад, могут оказаться совершенно устаревшими.
Количественные данные — это данные, которые определяются путем измерения. Они подразделяются на две группы [2].
1. К количественным данным относятся результаты измерения артериального давления, температуры, общего белка. Такие данные обычно имеют единицы измерения: в нашем примере — мм рт.ст., градусы Цельсия и граммы в 1 литре соответственно. Вышеперечисленные данные являются непрерывными, т.е. принимающими любое значение на непрерывной шкале. Особенность непрерывных количественных данных: они могут иметь бесконечное количество знаков после запятой.
2. Также к количественным данным относятся величины, принимающие лишь определенное значение из диапазона измерения. Они называются дискретными. Например, длительность заболевания или госпитализации, количество выкуриваемых сигарет, количество клеток крови, число беременностей у женщины. Дискретные данные также имеют единицы измерения — дни, годы, штуки, разы и т.д. Они обычно являются целочисленными. Количественные данные (и дискретные, и непрерывные) можно описать с помощью арифметических действий; они поддаются упорядочиванию: их можно расположить в порядке возрастания либо убывания принадлежат исследуемые данные [3]. По сути, целью анализа в данном случае является доказательство того, что исследуемая совокупность данных подчиняется нормальному закону распределения, или доказательство обратного. Существует множество видов распределений случайных величин (равномерное, экспоненциальное, Пуассона и т.д.), но мы остановимся лишь на нормальном распределении, так как при выявлении различия распределения от нормального обычно несущественно, к какому конкретно виду распределения относятся данные. Нормальное распределение, или распределение Гаусса, в природе встречается чаще всего, поэтому оно и было названо нормальным. Нормальное распределение вероятностей случайной величины — это симметричная относительно среднего значения кривая (рис. 1), часто ее называют колоколообразной.
Рисунок 2 – Внешний вид симметричного и несимметричных распределений данных
Очевидно, что колоколообразная кривая нормального распределения имеет асимметрию, равную нулю, так как график симметричен в обе стороны относительно среднего значения. В данном случае среднее значение, мода и медиана совпадают между собой. Коэффициент асимметрии больше нуля свидетельствует о правосторонней (положительной) асимметрии; в этом случае в выборке чаще всего встречаются значения больше среднего. Коэффициент асимметрии меньше нуля указывает на левостороннюю (отрицательную) асимметрию; в этом случае, напротив, в выборке чаще оказываются значения меньше среднего. Эксцесс, или Kurtosis (Е) — это мера остроты пика графика (рис. 3).
2 ПРАКТИЧЕСКАЯ ЧАСТЬ
Задание:
1) (N = 100): (сравнить возрастные группы):
- математическое ожидание;
- дисперсию эмпирическую;
- СКО;
- дисперсию теоретических данных по трендовой модели;
3) Определить основную тенденцию развития процесса (тренд) как функцию времени.
4) Определить закон распределения признака.
Подойдём к понятию математического ожидания. Пусть масса некоторого вещества распределена между точками оси абсцисс x1, x2, ..., xn. При этом каждая материальная точка имеет соответствующую ей массу с вероятностью из p1, p2, ..., pn. Требуется выбрать одну точку на оси абсцисс, характеризующую положение всей системы материальных точек, с учётом их масс. Естественно в качестве такой точки взять центр массы системы материальных точек. Это есть среднее взвешенное значение случайной величины X, в которое абсцисса каждой точки xi входит с "весом", равным соответствующей вероятности. Полученное таким образом среднее значение случайной величины X называется её математическим ожиданием.
Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных её значений на вероятности этих значений:
Фрагмент для ознакомления
3
1. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработкаданных. М.: Финансы и статистика, 1983.
2. Баврина А. П. Современные правила использования методов описательной статистики в медико-биологических исследованиях / А. П. Баврина // Медицинский альманах. – 2020. – № 2(63). – С. 95-105.
3. Гланц С. Медико-биологическая статистика. М: Практика; 1998
4. Елисеева И. И., Рукавишников В. О. Логика прикладного статистического анализа. М: Финансы и статистика, 1982.
5. Елисеева И. И., Юзбашев М. М. Общая теория статистики: учебник / под ред. И. И. Елисеевой. М.: Финансы и статистика, 1995.
6. Каяйкина М. С. Выбор типа линии при аналитическом выравнивании динамических рядов урожайности сельскохозяйственныхкультур // Записки ЛСХИ, Ленинград — Пушкин, 1972. Т. 196.
7. Математическая статистика : учеб.-метод. пособие / авт.-сост. : С. Е. Демин, Е. Л. Демина ; М-во образования и науки РФ ; ФГАОУ ВО «УрФУ им. первого Президента России Б.Н.Ельцина», Нижнетагил. технол. ин-т (фил.). – Нижний Тагил : НТИ (филиал) УрФУ, 2016. – 284 с.
8. Пеккер Я.С., Бразовский К.С. Математическое моделирование поливариантых живых систем. Учебное пособие. – Томск: Изд. СибГМУ, 2019. – 146 с
9. Орлова И. В., Половников В. А. Экономико-математические методы и модели: компьютерное моделирование: учеб. пособие. М.: ИНФРА-М, 2010.
10. Петри А., Сабин К. Наглядная медицинская статистика. Учебное пособие. М: ГЭОТАР-Медиа; 2019
11. Реброва О. Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М: МедиаСфера; 2000
12. Martinez E. Z. Description of continuous data using bar graphs: a misleading approach. Rev Soc Bras Med Trop 2015; 48(4): 494–497, https://doi.org/10.1590/0037–8682–0013–2015.
13. Pleil J.D. QQ-plots for assessing distributions of biomarker measurements and generating defensible summary statistics. J Breath Res 2016; 10(3): 035001, https://doi.org/10.1088/1752–7155/10/3/035001.